o3首战

陶哲轩都惊了!o3首战“AI奥数”碾压夺冠,开源军团仅差5分狂追OpenAI

以上这些结果,皆具鲁棒性。原因在于:题目数量多且难度高,多数达到国家数学奥赛水平,少部分略易或略难,接近IMO难度级别。对所有o3-preview版本的评测,都在一个很短的时间窗口内(数小时)完成。并且AIMO获得了原始API输出的访问权限,便于复核与分析。这

开源 首战 奥数 陶哲轩 o3首战 2025-09-08 14:24  1